Tobias KlugMethoden und Werkzeuge zur automatischen Kontrolle der Thread-Platzierung auf Mehrkernprozessoren | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ISBN: | 978-3-8440-0177-8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reeks: | Research Report Series Lehrstuhl für Rechnertechnik und Rechnerorganisation Technische Universität München Uitgever: Prof. Dr. A. Bode München | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Volume: | 35 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Trefwoorden: | Pinning; Thread-Platzierung; CMP; automatische Performance-Analyse; Mehrkernprozessoren; Rechnerarchitektur | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Soort publicatie: | Dissertatie | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Taal: | Duits | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pagina's: | 178 pagina's | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Gewicht: | 264 g | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Formaat: | 21 x 14,8 cm | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bindung: | Softcover | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prijs: | 48,80 € / 97,60 SFr | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Verschijningsdatum: | Juni 2011 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kopen: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Download: | Beschikbare online documenten voor deze titel: U heeft Adobe Reader, nodig, om deze bestanden te kunnen bekijken. Hier vindt u ondersteuning en informatie, bij het downloaden van PDF-bestanden. Let u er a.u.b. op dat de online-bestanden niet drukbaar zijn.
Gebruikersinstellingen voor geregistreerde online-bezoekers Hier kunt u uw adresgegevens aanpassen en uw documenten inzien.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Aanbevelen: | Wilt u dit boek aanbevelen? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Recensie-exemplaar | Bestelling van een recensie-exemplaar. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Verlinking | Wilt u een link hebben van uw publicatie met onze online catalogus? Klik hier. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Samenvatting | Die Taktfrequenz von Mikroprozessoren wurde noch vor wenigen Jahren mit jeder neuen Prozessorgeneration kontinuierlich erhöht. Aufgrund von physikalischen Rahmenbedingungen wie Energiebedarf oder Wärmeabgabe konnte diese Entwicklung nicht beliebig weiterverfolgt werden. Um weiterhin Leistungssteigerungen zu gewährleisten, werden derzeit mehrere vollständige Prozessorkerne in einen Chip integriert. Um die volle Leistungsfähigkeit dieser Mehrkernprozessoren optimal auszunutzen, müssen die darauf ablaufenden Programme parallelisiert werden. Da die Parallelisierung von Programmen bzw. deren Optimierung fehleranfällig und zeitaufwendig ist, benötigen Entwickler Konzepte und Werkzeuge, die sie dabei unterstützen. Diese Arbeit befasst sich mit dem Thema der Platzierung von Threads auf Mehrkernrechnern mit gemeinsamem Speicher. Die Architektur aktueller Mehrkernprozessoren wird ebenso vorgestellt und klassifiziert wie gängige Methoden der Leistungsbewertung von Rechnersystemen und Programmen. Auf dieser Basis werden Konzepte erarbeitet, um die optimale Thread-zu-Kern-Platzierung (Kernbindung) für ein zu untersuchendes Programm hinsichtlich eines gegebenen Optimierungsziels (z.B. kürzeste Programmlaufzeit oder niedrigster Energieverbrauch) zu ermitteln. Dabei finden die Besonderheiten von Mehrkernprozessoren wie gemeinsame Cache-Speicher oder schnelle Verbindungsnetzwerke auf dem Chip Berücksichtigung. Die wesentlichen Erkenntnisse der erarbeiteten Konzepte werden in einem prototypischen Werkzeug umgesetzt, das zur Programmlaufzeit verschiedene Kernbindungen untersucht und bewertet. Anhand der Anwendungsprogramme aus dem SPEC-OMP-Benchmark wird gezeigt, dass das entwickelte Werkzeug einen Anwender in die Lage versetzt, die optimale Kernbindung für seine Problemstellung auf den verschiedenen Klassen von Mehrkernrechnern zuverlässig zu ermitteln. Der zeitliche Mehraufwand, der durch die Verwendung des Werkzeugs entsteht, wird untersucht und ausführlich dargestellt. Exemplarisch wird nachgewiesen, dass auch bei parallelen Programmen, die auf Nachrichtenaustausch basieren, eine optimale Prozessplatzierung signifikante Leistungssteigerungen mit sich bringen kann. Abschließend wird anhand einer parallelen Anwendung aus dem Bereich der Nuklearmedizin der Einfluss verschiedener Kernbindungen auf die elektrische Leistungsaufnahme untersucht. Es wird aufgezeigt, dass für die eingesetzte Architektur unterschiedliche Kernbindungen zu stark variierender Energieaufnahme führen. |